← 返回第3章导航

3.5 Skewness

偏度 - 描述数据分布形状的重要指标

学习目标

通过本节学习,你将掌握:

  • 偏度概念:理解偏度的定义和作用
  • 分布类型:识别对称、正偏、负偏三种分布
  • 判断方法:掌握多种偏度判断技巧
  • 计算公式:学会使用偏度公式进行计算
  • 实际应用:了解偏度在数据分析中的意义

偏度类型

三种分布类型

对称分布

\( Q_2 - Q_1 = Q_3 - Q_2 \)

众数 = 中位数 = 均值

偏度 = 0

正偏(Positive Skew)

\( Q_2 - Q_1 < Q_3 - Q_2 \)

众数 < 中位数 < 均值

偏度 > 0

负偏(Negative Skew)

\( Q_2 - Q_1 > Q_3 - Q_2 \)

众数 > 中位数 > 均值

偏度 < 0

偏度的关键特征

  • 对称分布:数据均匀分布,左右对称
  • 正偏:数据多集中在较低值,右侧有长尾
  • 负偏:数据多集中在较高值,左侧有长尾
  • 判断方法:箱线图对比、位置度量关系、偏度公式

核心应用

偏度的主要用途

  • 分布描述:描述数据集的分布形状
  • 统计量选择:指导选择合适的统计量
  • 数据分析:理解数据的特征和模式
  • 模型选择:为统计建模提供参考
  • 异常值识别:帮助识别数据中的异常情况